知识库解析文件(异步)

curl -X POST 'https://HOST:PORT/api/v1/third_interface/knowledge/process'

鉴权

出于安全考虑,必须将 TOKEN 存储于服务端并通过后端接口调用,避免在前端代码中直接暴露,以防止凭证泄露造成损失

请在 HTTP 请求的 Authorization 请求头中包含您的 TOKEN,格式如下:

Authorization: Bearer {YOUR_TOKEN}

TOKEN获取可通过 个人令牌 和 OAuth 应用获取,具体见 个人令牌授权OAuth 授权码授权

应用秘钥private_key 的获取具体见 生成应用密钥

Request Body

  • knowledge_id (int): 知识库ID
  • auto (boolean): 是否自动处理 建议为true
  • is_img (boolean): 是否解析图片 [默认: false]
  • is_re (boolean): 替换掉连续的空格、换行符和制表符 [默认: false]
  • is_uri (boolean): 删除文档中的链接和电子邮箱地址 [默认: false]
  • is_ocr (int): 图片处理选项 1 OCR识别 2图片模型识别 *is_img启用后生效
  • is_deep_resolve (boolean): 是否深度解析 [默认: false]
  • smart_split_strategy (dict): 数据分段方式
    • split_type (int): 分段类型 1智能分段 5语义分段 6递归分段
  • file_path (array): 文件路径列表
    • { file_path (string): 文件访问路径, object_name (string): 文件原始名称 }
    • ...

文件地址的获取具体见 知识库上传文件

Response

  • status_code (int): 状态码,200表示成功

  • status_message (string): 状态信息

  • data (array): 返回的数据

响应示例

{
  "status_code": 200,
  "status_message": "SUCCESS",
  "data": []
}